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基于 改进 VNet 太 阳 暗 条 检测 方法 
FAR, BRE 
(昆明 理工 大 学 信息 工程 与 自动 化 学 院 ， 云 南 昆明 650500) 

摘 要 : 太阳 暗 条 作为 太阳 大 气 磁 场 的 示 踪 ， 其 精准 检测 对 研究 太阳 磁场 有 着 极其 重要 
的 意义 。 针 对 现 有 上 暗 条 检测 的 方法 存在 检测 精度 不 高 ， 弱 小 瞳 条 错 检 、 漏 检 等 问题 ， 本 文 为 
此 提出 一 种 基于 改进 VNet 网 络 的 太阳 瞳 条 检测 方法 。 首 先 ， 使 用 大 能 湖 天文 台 Ha 全 日 面 图 
像 并 结合 磁 图 制作 了 太阳 了 瞳 条 数据 集 ; 其 次 ,在 VNet 网 络 下 采样 部 分 采用 inception 模 块 融合 
不 同 尺度 特征 图 特征 , 同时 加 入 注意 力 机 制 来 增强 特征 图 中 暗 条 部 分 的 语义 信息 ; 最 后 在 上 
采样 部 分 引入 深度 监督 模块 , 更 多 地 保留 太阳 上 暗 条 细节 特征 . 为 验证 算法 性 能 , 本 文采 用 191 
幅 Ha 全 日 面 图 像 数据 集 ， 其 中 包含 暗 条 共 3372 条 。 算 法 在 测试 数据 集 上 平均 准确 率 达到 
0.9883，F1 值 达到 0.8385。 实 验 结果 证 明 ， 该 方法 可 以 有 效 识 别 Ha 全 日 面 图 中 暗 条 。 
关键 词 : 上 暗 条 检测 ;太阳 瞳 条 数据 集 ; VNet Inception; 深度 监督 ;注意 力 机 制 
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条 的 尺度 、 活 动 状态 各 不 相同 ,不 同 的 瞳 条 最 终 会 消失 或 者 爆发 。 暗 条 爆发 与 太阳 次 斑 、 H 
园 物 质 抛射、 人 磁 风 其 等 事件 有 非常 密切 的 关系 , 强烈 的 上 暗 条 爆发 活动 所 发 射 的 等 离子 体 在 几 
天 后 将 抵达 地 球 ， 影 响 地 球 磁 层 ， 严 重 时 会 导致 通 信 设 备 受 损 ， 千 成 通信 中 断 、 航 空运 输 导 
航 失效 等 灾难 中。 此 外 ， 暗 条 通常 出 现在 光 球 磁 场 极 性 反 转 线 的 上 方 ， 因 此 对 暗 条 进行 研究 
有 助 于 探究 太阳 倍 场 的 变化 过 程 。 作 为 相关 研究 的 基础 和 前 提 , 对 暗 条 准确 地 检测 具有 重要 
的 科学 意义 。 

根据 光学 厚 的 瞳 条 物质 会 吸收 大 量 光 球 背景 辐射 但 发 射出 很 少 这 一 特征 ， 在 Ho 波段 观 
测 到 的 太阳 暗 条 会 比 周 围 背景 更 暗 。 在 此 基础 上 , 大 量 学 者 对 自动 检测 太阳 暗 条 方法 展开 了 
一 系列 研究 ， 具 体 可 以 分 为 如 下 三 类 : (一 ) 基于 阐 值 检测 方法 。 壁 如 ，Gao 等 0" 采用 全 
局 阔 值 和 区 域 增长 算法 来 自动 检测 暗 条 ;Fuller 和 Aboudarham 等 57 在 Gao 的 研究 基础 上 采用 
局 部 阔 值 代替 全 局 阔 值 改善 全 日 面 图 像 具有 临 边 昏 暗 和 亮度 不 均匀 这 一 问题 ; Qu JH 
Canny 算 子 进 行 瞳 条 边缘 检测 后 ， 利 用 形态 学 腐蚀 膨胀 法 检测 出 上 暗 条 。 此 类 方法 计算 复杂 度 
较 低 ， 只 需 关 注 暗 条 图 像 特征 , 不 需要 人 工 标 注 数 据 集 , 但 是 将 图 像 中 噪声 点 和 较 暗 背 景 容 
易 误 识别 为 暗 条 ， 检 测 结果 精确 率 较 低 。 (二 ) 基于 机 器 学 习 方 法 。 壁 如 ，Zharkova 等 >*" 
利用 人 工 神 经 网 络 检测 上 暗 条 , 通过 一 个 预先 定义 大 小 窗口 逐个 像素 点 来 检测 上 暗 条 , 对 不 同 背 
景 中 的 瞳 条 , 训练 后 的 神经 网 络 能 够 正确 识别 出 。 此 类 方法 可 以 有 效 克 服 对 图 像 归 一 化 过 程 
的 高 度 依赖 性 ， 利 用 先 验 信息 设 定 合适 的 特征 提取 器 ， 特 征 提 取 效 率 高 ， 模 型 训练 速度 快 ， 
但 是 模型 泛 化 性 较 差 , 一些 复杂 形态 结构 的 上 暗 条 不 能 有 效 地 自 适 应 建 模 ,对 弱小 暗 条 不 敏感 ， 
检测 结果 存在 弱小 暗 条 断裂 和 漏 检 问题 。 三) 基于 深度 学 习 方 法 。 深 度 学 习 方 法 可 以 更 好 
也 学 习 图 像 特征 ， 在 天 文 图 像 处 理 方面 取得 很 大 成 功 ， 已 引起 广大 学 者 关注 1。 辟 如 ， 
alasal 采用 Mask R-CNN 用 于 检测 瞳 条 ， 数 据 集 采 用 印度 尼 西 亚 航 空 航天 研究 所 拍摄 的 Ha 
波段 全 日 面 图 像 ， 使 用 ResNet-101 和 特征 金字 塔 网 络 作为 骨干 网 络 ， 利 用 训练 好 模型 进行 
阳 暗 条 检测 ; Zhu" 采用 基于 UNet 深 度 学 习 网 络 识 别 太阳 上 暗 条 ,数据 集 采 用 大 熊 湖 天 文 台 拍 
摄 的 Ha 波段 全 日 面 图 像 ， 同时 在 UNet 网 络 的 下 采样 部 分 加 入 Dropout 层 ,在 上 采样 部 分 用 线 
性 插值 代替 反 卷 积 ， 改 进 后 的 UNet 网 络 用 于 太阳 瞳 条 检测 。 此 类 方法 相 比 机 器 学 习 方法 ， 
无 需 人 工 设 计 特征 提取 器 , 可 以 根据 标签 自动 学 习 瞳 条 的 特征 及 细节 信息 , 总 体 算 法 的 泛 化 
性 和 和 鲁 棒 性 较 高 。 但 是 此 类 方法 存在 标签 不 准确 的 问题 ,标签 中 存在 太阳 黑子 及 噪声 点 , 干 


TT 


wu 


ea 


ET] 


H 
日 


/- H 
FA 


上 


Hil 
HTU 


202103.00106v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


扰 网 络 提取 暗 条 特征 ， 导 致 训练 模型 不 精准 。UNet 网 络 在 下 采样 过 程 中 提取 特征 能 力 不 够 ， 


会 丢失 暗 条 细节 特征 ,在 上 采样 过 程 中 ,只 对 网 


络 最 终 输 出 结果 进行 调整 ,中 间 特 征 图 没有 


得 到 充分 训练 ， 检 测 结果 存在 弱小 暗 条 断裂 ， 甚 至 漏 掉 、 背 景 被 误 识别 为 暗 条 等 问题 。 


针对 当前 瞳 条 检测 存在 的 问题 , 为 了 让 网 络 能 够 学 习 到 更 准 


角 的 上 暗 条 特征 ,本文 首 次 结 


合 太 阳 磁 图 ， 对 数据 集中 太阳 瞳 条 进行 手工 标注 。 在 训练 网 络 前 对 图 像 进行 亮度 归 一 化 、 去 


噪 等 预 处 理 。 采 用 VNet! 网 络 ， 该 网 络 具 有 较 强 抗 干扰 能 力 ， 可 以 有 效 抑制 背景 对 检测 结 
FE， 对 VNet 网 络 进行 改进 ， 改 进 后 的 网 络 能 更 精确 地 
检测 出 弱小 暗 条 。 本 文 主要 工作 是 : (1) 结合 太阳 磁 图 制作 了 太阳 暗 条 数据 集 ， 相 对 已 有 


果 的 影响 。 为 了 充分 提取 暗 条 细节 特 和 


的 暗 条 数据 集 ， 该 数据 集 制作 时 ,根据 同一 时 刻 太 阳 磁 图 的 磁场 分 布 结构 ， 别 除了 黑子 和 咱 
声 ， 保 留 了 弱小 暗 条 ， 暗 条 标签 更 精确 ; 〈2) 在 网 络 下 采样 部 分 采用 Inception 模 块 "MH， 用 


于 提取 不 同 尺度 特征 图 的 特征 ， 引 入 注意 力 机 制 ”， 抑 制 背景 图 像 中 干扰 特征 的 影响 ， 在 
上 采样 部 分 引入 深度 监督 模块 '"， 将 不 同 深度 特征 图 进行 融合 ， 提 高 了 检测 结果 的 准确 率 。 
最 后 通过 实验 证 明 ， 所 提 方 法 能 对 太阳 暗 条 实现 较 高 精度 的 检测 。 


1 太阳 暗 条 数据 集 


1.1 数据 预 处 理 
这 条 数据 集 取 自 美国 大 能 湖 天 文 台 的 Ha 全 日 面 图 像 ， 其 观测 设备 位 于 地 球 ， 由 于 太阳 


与 地 球 之 间距 离 变 人 化， 温度、 湿度 、 风 速 等 原因 ， 导 人 至 其 拍摄 到 的 
同时 地 面 仪器 还 会 受到 光线 、 大 气 拌 动 等 复杂 因素 影响 ,从 而 造成 拍 
扰 、 亮 度 不 均匀 等 问题 。 此 类 情况 出 现 ， 将 会 在 一 定 程度 上 影响 网 络 检测 结果 准确 率 和 召回 


率 。 针 对 这 些 问题 ， 首 先 使 用 霍 夫 圆 检测 法 和 最 小 二 乘 拟 合 法 来 获得 太 
图 像 中 心 点 坐标 和 太阳 圆心 坐标 ， 将 太阳 圆心 平移 到 图 像 中 心 点 ， 当 两 种 方法 相差 5 个 像素 
时 ， 人 工 进行 调整 ， 得 到 太阳 轮廓 ， 并 将 轮廓 外 像素 设置 为 灰色 ， 避 免 干 扰 网 络 训练 ， 其 次 
利用 全 变 分 模型 去 除 背 景 干扰 噪声 ; 最 后 通过 增强 图 像 对 比 度 来 突出 瞳 条 特征 , 通过 剪 切 去 
P 极 值 像素 点 ， 剩 余部 分 像素 按 比 例 重 新 分 配 分 布 。 预 处 理 后 图 像 如 图 1 所 示 ， 可 以 
看 出 经 过 预 处 理 操 作 后 图 1(b) 中 暗 条 特征 更 加 明显 。 


RER 


图 像 并 不 是 在 图 像 正中 ， 
摄 全 日 面 图 中 有 噪声 干 


阳 中 心 和 半径 ,计算 


图 1 (a@) 原 始 图 像 ，(b) 预 处 理 后 图 像 


Fig.1 (a) original image; (b) processed image 


1.2 ”制作 数据 集 


数据 是 深度 学 习 的 血液 , 基于 深度 学 习 的 瞳 条 图 像 分 割 算法 需要 从 标注 好 数据 中 学 习 暗 
条 特征 信息 ， 从 而 不 断 调节 网 络 中 每 一 层 参数 ， 标 注 数 据 有 偏差 会 导致 训练 模型 难以 收敛 ， 
检测 结果 不 精准 , 其 结果 甚至 不 会 超过 传统 阔 值 分 割 法 。 目前 公开 的 太阳 暗 条 数据 集 来 自 中 
国 科 学 院 国家 天 文 台 '"， 该 数据 集 取 自 美国 大 熊 湖 天 文 台 的 Ha 全 日 面 


”本 文 数据 集 公 开 在 https://github.com/huan819/fv 


图 像 ， 但 其 瞳 条 数据 
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集 标注 方法 是 根据 瞳 条 亮度 特征 , 采用 图 像 阔 值 分 割 处理 方法 ,导致 图 像 中 太阳 黑子 和 小 品 
声 点 也 会 被 标注 出 来 ， 同 时 也 会 漏 掉 弱小 暗 条 ， 致 使 网 络 提取 到 错误 特征 信息 ， 造 成 暗 条 漏 
检 和 背景 误 识别 。 图 2 为 中 国 科学 院 国家 天 文 台数 据 集中 普遍 存在 一 些 问 题 。 图 2(a) £L 
色 框 处 是 全 日 面 图 中 太阳 黑子 ， 图 2 (b) 红色 框 处 是 对 应 标签 中 太阳 黑子 ， 图 2(c) 红色 框 处 
是 全 日 面 图 中 弱小 暗 条 ， 黄 色 框 处 是 噪声 点 ， 图 2(d) 红色 框 处 是 对 应 标签 中 漏 掉 的 弱小 暗 
条 ,黄色 框 处 是 噪声 黑 点 。 为 了 提高 训练 准确 率 进而 提升 模型 准确 率 ， 本 文 制 作 并 公开 了 太 
阳 上 暗 条 数据 集 ， 该 数据 集 包括 两 个 部 分 Ha 全 日 面 图 像 和 暗 条 二 值 标签 图 。Hao 全 日 面 图 像 
取 自 美国 大 熊 湖 天 文 台 2010—2020 年 拍摄 的 Ho 波段 的 全 日 面 图 像 。 


TH 


图 2 国家 天 文 台数 据 集中 。(a) 和 (c)Ha 全 日 面 图 像 ，(b) 和 (d) 太 阳 上 暗 条 标签 图 
Fig.2 National astronomical observatory database! (a) and (c) Ha full-disk solar image; (b) and (d) 
ground-truth image 

瞳 条 与 做 场 有 着 密切 的 关系 , 暗 条 存在 于 太阳 磁场 极 性 反 转 线 的 上 方 , 极 性 反 转 线 是 指 
径 向 磁场 在 光 球 上 正 负 磁场 的 分 界线 。 另 外 ， 太 阳 黑 子 位 于 单一 极 性 区 域 ， 而 非 极 性 反 
转 线 上 。 利 用 该 特征 ， 根 据 同一 时 刻 美 国 国立 太阳 天 文 台 全 球 日 震 观测 网 (Global Oscillation 
Network Group ,GONG) 观 测 的 太阳 磁 图 中 正 负 磁极 的 位 置 ， 即 图 3(b) 中 黑白 相交 的 位 置 ， 结 
合 瞳 条 的 亮度 和 纹理 特征 ， 同 时 利用 人 磁 图 排除 黑子 对 上 暗 条 检测 结果 的 干扰 ， 采 用 Labelme 标 
注 工具 对 上 暗 条 进行 描 点 标注 。 图 3(a) 为 全 日 面 图 像 ， 图 3(b) 为 全 日 面 太 阳 磁 图 ; 图 3(c) 为 瞳 条 
标签 图 。 图 3(b) 中 红色 线条 为 标注 的 磁 中 性 线 ， 可 发 现 与 图 3(a) 红 色 框 对 应 图 3(b) 中 的 位 置 ， 
并 无 正 负 磁场 出 现 ， 因 此 在 制作 标签 时 ， 该 位 置 不 存在 上 暗 条 。 本 文 数据 集 包 含 191 幅 全 日 面 
sr nsn m a a s 

包含 的 瞳 条 特征 较为 完整 ， 因 此 训练 集 图 像 取 自 2013 一 2014 年 的 全 日 面 图 像 共 146 幅 。 测 
图 像 取 上 自 其 余年 份 的 全 日 面 图像 共 45 幅 。 
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图 3 ”上 暗 条 数据 集 和 磁 图 。(a) 全 日 面 Hao 图像，(b) 全 日 面 太 阳 磁 图 ，(c) 太 阳 暗 条 标签 图 


Fig.3 Solar filaments database and magnetograms image. (a) full-disk Ha solar image; (b) full-disk solar 


magnetograms image; (c) ground-truth image 


2 方法 原理 


Fausto Milletari 等 上 提出 VNet 网 络 用 于 医学 图 像 的 分 割 ， 由 于 太阳 上 暗 条 和 医学 图 像 都 具 
有 制作 标签 成 本 高 、 数 据 训 练 样本 比较 少 的 特点 ， 而 VNet 网 络 只 需要 少量 的 训练 样本 就 可 
以 训练 出 模型 ， 并 且 VNet 网 络 在 上 采样 和 下 采样 过 程 中 加 入 残 差 结构 ， 解 决 了 深层 网 络 的 
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梯度 消失 的 问题 。 此 外 VNet 网 络 抗 干扰 能 力 较 强 ， 可 以 有 效 抑制 背景 对 暗 条 检测 结果 的 影 
响 ， 因 此 本 文采 用 改进 原 有 VNet 网 络 来 检测 太阳 上 暗 条 。 

VNet 网 络 由 下 采样 部 分 和 上 采样 部 分 构成 '，VNet 网 络 结构 如 图 4 所 示 。 下 采样 部 分 主要 
功能 是 提取 图 像 特征 ， 包含 5 个 卷 积 单元 , 每 个 卷 积 单元 由 卷 积 层 、 池 化 层 和 激活 函数 组 成 ， 
卷 积 采用 5x5x5 的 卷 积 核 进行 卷 积 ，padding 大 小 为 2，stride 为 1。 池 化 层 可 以 减少 训练 过 程 
中 的 参数 ， 减 少 内 存 占用 率 ， 提 高 训练 速度 。 激 活 函 数 采 用 PReLUW™ 函数。 卷 积 块 中 还 加 
入 了 残 差 学 习 结 构 ， 有 效 缓解 梯度 消失 的 问题 。 下 采样 部 分 和 上 采样 部 分 中 间 为 级 联 。 级 联 
是 将 下 采样 过 程 中 的 特征 图 与 上 采样 反 卷 积 后 的 特征 图 进行 融合 , 再 进行 卷 积 操作 , 这 样 可 
以 有 效 防止 下 采样 过 程 中 特征 丢失 ,保留 在 下 采样 部 分 的 目标 位 置信 息 以 及 图 像 的 边缘 特 
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图 4 VNet 算法 结构 图 
Fig.4 Structure of VNet algorithm 


2.4 改进 的 VNet 网 络 


原始 的 YNet 网 络 能 够 很 好 抑制 图 片 背景 的 干扰 ， 但 是 暗 条 大 小 尺度 不 一 ， 弱 小 瞳 条 的 
特征 难以 提取 ， 容 易 造 成 细节 信息 丢失 、 瞳 条 断裂 等 问题 ， 针 对 这 些 问 题 ， 本 文 提 出 一 种 基 
于 改进 VNet 网 络 的 上 暗 条 检测 算法 。 网 络 整 体 分 为 下 采样 部 分 和 上 采样 部 分 ， 改 进 VNet 网 络 
如 图 5 所 示 。 本 文保 留 了 VNet 网 络 基本 结构 ， 图 像 输入 后 ， 首 先 经 过 Inception 模 块 学 习 到 不 
同 尺度 特征 图 特征 ， 并 融合 输入 下 一 层 ,提升 网 络 性 能 ， 并 在 上 采样 的 第 二 个 和 第 三 个 卷 积 
单元 中 加 入 注意 力 机 制 , 更 好 地 利用 上 下 文 信息 ,增强 特征 图 中 瞳 条 部 分 的 语义 信息 ， 提 升 
网 络 对 重要 信息 特征 的 学 习 能 力 。 在 上 采样 部 分 引入 深度 监督 模块 , 充分 提取 太阳 上 暗 条 特征 ， 
改进 后 网 络 模型 能 够 充分 提取 太阳 上 暗 条 特征 ， 提 高 了 太阳 上 暗 条 检测 精度 。 
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Fig.5 Structure of improved VNet algorithm 
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22 ”Inception 模 块 


太阳 暗 条 尺度 信息 存在 较 大 差异 , 选择 合适 尺寸 卷 积 核 比较 困难 , 大 尺度 太阳 暗 条 长 度 
可 达 100 个 像素 ， 信 息 分 布 更 具有 全 局 性 ， 采 用 大 尺寸 卷 积 核 提取 特征 比较 全 面 ， 小 尺度 太 
阳 瞳 条 长 度 约 10 个 像素 ,信息 分 布 比较 局 部 ， 适 合 较 小 卷 积 核 。 为 了 提取 更 多 太阳 暗 条 有 效 
特征 同时 减少 参数 量 ， 图 像 输入 后 首先 经 过 Inception 模 块 029， 通 过 增加 卷 积 单元 个 数 ， 对 较 
大 的 卷 积 核 先 用 1 X1 的 卷 积 核 进行 降 维 操作 , 使 输入 图 像 在 不 同 尺 度 上 进行 融合 , 提取 不 同 
尺度 特征 ， 同 时 提高 了 网 络 计 算 资源 利用 率 , 提升 网 络 性 能 ， 克 服 数据 样本 较 少 带 来 训练 过 
拟 合 的 问题 。Inception 模 块 如 图 6 所 示 。 在 同一 层级 上 运行 多 个 尺寸 的 滤波 器 ， 使 用 4 个 大 小 
不 同 滤波 器 ， 分 别 是 1X1，1 X1，3X3,5X5 大 小 的 卷 积 核 ， 在 3X3 和 5 X5 的 卷 积 层 前 添加 
1X1 卷 积 核 ， 调整 输入 通道 数量 , 减少 参数 量 。 在 1 X 1 的 卷 积 层 前 加 入 3X3 最 大 池 化 层 用 来 
提升 网 络 训练 速度 ,同时 提高 所 提取 特征 的 鲁 棒 性 。 最 后 ， 将 不 同 卷 积 核 所 获得 的 太阳 暗 条 
特征 图 进行 融合 ， 进 一 步 提 高 网 络 泛 化 能 


图 6 Inception 结构 
Fig.6 Structure of Inception 


2.3 注意 力 机 制 


下 采样 过 程 中 对 图 像 不 断 卷 积 提取 图 像 特征 ， 造 成 了 上 暗 条 边缘 及 细节 信息 丢失 ， 虽 然 
VNet 网 络 采 用 了 路 连接 融合 特征 图 保留 了 一 些 信 息 ， 但 是 不 同 空间 位 置 所 包含 信息 的 重要 
程度 不 一 样 , 图 像 中 不 同位 置 应 该 具有 不 同 权 重 , 本 文 在 下 采样 特征 提取 过 程 中 加 入 空间 注 
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图 像 经 过 下 采样 过 程 中 第 二 个 卷 积 单元 得 到 特征 图 ， 如 图 7 所 示 ， 首 先 对 其 分 别 使 用 最 
大 值 和 平均 值 全 局 池 化 操作 , 最 大 值 池 化 操作 可 以 突出 瞳 条 特征 , 平均 值 池 化 操作 可 以 获取 
全 局 信息 ， 将 两 种 池 化 后 特征 图 按 通道 拼接 后 进行 1X1 卷 积 并 添加 非 线性 成 分 ， 然 后 通过 
sigmoid 激 活 函数 计算 得 出 空间 注意 力 权 重 的 空间 和 矩阵，sigmoid 函 数 可 以 避免 特征 在 传递 过 
程 中 过 于 稀 玻 及 权重 系数 过 大 。 经 过 sigmoid 函 数 得 到 权重 系数 与 输入 特征 图 相 乘 得 到 新 特 
征 图 。 空 间 注意 力 机 制 可 表示 为 : 

M.(F)=o(MLP(AugPool(F))+ MLP(MaxPool(F))) Q) 

其 中 ，M.(F) 为 生成 空间 注意 力图 ; c 表示 特征 图 通道 数 ，MLP 表示 多 层 感知 器 ; 
o AR sigmoid 激活 函数 ;， AugPool(F) 和 MaxPool() 分 别 表示 对 特征 图 平均 值 全 
局 池 化 和 最 大 值 全 局 池 化 。 

注意 力 机 制 可 以 让 网 络 提取 特征 更 加 专注 瞳 条 特征 , 抑制 背景 噪声 等 异常 特 
征 信息 ， 精 准 检 测 出 弱小 暗 条 ， 提 高 暗 条 检测 精度 。 


图 7 空间 注意 力 结构 
Fig.7 Structure of Spatial attention 
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Lee 等 53 提出 一 种 深度 监督 网 络 (IDeeply-supervised nets,DNS)。 深度 监督 能 够 对 前 面 层 的 
训练 起 到 监督 作用 ， 从 而 保证 整个 网 络 训练 效果 。 本 文采 取 深 度 监督 方法 调整 每 一 层 特 征 图 
参数 , 保证 输出 层 和 隐藏 层 都 能 尽量 学 到 该 层 尽 可 能 多 的 细节 特征 ， 从 而 保证 更 上 层 网 络 能 
够 使 用 更 加 精确 的 特征 图 进行 训练 。 
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图 8 深度 监督 模块 


Fig.8 Deep supervision module 
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深度 监督 模块 如 图 8 所 示 。 每 个 上 采样 过 程 中 有 一 个 额外 的 分 支 操 作 ， 该 分 支 操 作 是 将 
不 同 尺 度 特征 图 通过 上 采样 放大 将 图 像 恢 复 到 原始 图 像 大 小 ， 分 别 是 mapl1，map2，map3， 
map4， 再 将 4 个 阶段 的 map 进 行 融合 。 通 过 对 不 同 尺度 特征 图 进行 监督 ， 不 同 尺度 特征 图 都 
能 学 到 最 准确 的 特征 ， 提 高 网 络 检测 准确 率 。 


3 实验 过 程 及 结果 分 析 


3.1 训练 细节 


所 有 实验 均 在 Windows10 系 统 下 进行 ,其 中 深度 学 习 框架 为 Keras, 硬件 环境 :CPU 为 Intel 
Core i7-7800X 3.50GHz CPU， 显 卡 为 GTX Titan X GPU， 内 存 32G 。 数 据 集 采 用 自己 制作 暗 
条 数据 集 ， 并 且 对 数据 集 进 行 预 处 理 操作 。 本 文选 取 了 太阳 暗 条 数据 集 共 146 对 预 处 理 图 像 
和 上 暗 条 标签 作为 数据 集 。 在 训练 阶段 batch_size=2， 每 轮 和 迭代 300 步 ， 计 划 训 练 epochs 为 200 
$6: 采用 早 停 法 控制 训练 过 程 ， 若 函数 在 10 个 epoch 内 模型 损失 没有 下 降 则 停止 训练 ， 学 习 
率 初 始 值 0.0001， 学 习 率 衰减 策略 为 若 3 个 epoch 里 loss 没 有 下 降 ， 则 学 习 率 减 半 ; 最 终 在 151 
轮训 练 停止 。 从 图 9 可 以 看 出 ， 训 练 随 着 轮 次 增加 ， 损 失 值 不 断 下 降 ， 然 后 曲线 呈现 微小 波 
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在 选择 优化 器 时 ， 在 训练 过 程 中 会 产生 大 量 参数 ， 导 致 计算 量 增加 。 本 文采 用 Adam 优 
化 器 中 来 训练 网 络 。 该 算法 优点 在 于 可 以 在 训练 过 程 中 可 以 为 不 同 的 参数 计算 不 同 自 适应 
学 习 率 ， 有 利于 网 络 优化 ， 适 用 于 包含 大 规模 参数 的 问题 ， 并 且 对 内 存 需求 较 小 。 


32 ”数据 增强 


在 深度 学 习 中 , 训练 集 样本 较 少 是 造成 过 拟 合 的 主要 原因 之 一 。 由 于 太阳 暗 条 图 像 人 工 
标注 成 本 很 高 ， 数 据 集 较 少 ， 因 此 本 文 在 训练 同时 利用 keras 中 ImageDataGenerator 图 片 生成 
器 对 训练 图 像 进行 旋转 、 垂 直 翻 转 、 平 移 等 操作 来 扩充 数据 。146 组 图 像 经 数据 增强 后 生成 
26648 个 训练 样本 ， 提 高 了 模型 泛 化 能 力 和 和 鲁 棒 性 。 


33 ”损失 函数 


在 太阳 上 暗 条 检测 中 ， 太 阳 上 暗 条 仪 占 整 个 Ha 全 日 面 图 像 约 5% 区 域 ， 在 训练 过 程 中 容易 导 
致 损失 函数 陷入 局 部 最 小 值 ， 导 致 检测 结果 偏向 背景 ， 漏 检 弱 小 暗 条 ,为 了 有 效 解决 前 景 和 
背景 像素 体 严 重 失衡 情况 , 损失 函数 采用 基于 Dice 系 数 最 大 化 目标 函数 "来 优化 模型 ,其 公 


式 定义 如 下 : 


2x N(A, r^ Ag) + Smooth (3) 
N(A,) + N(AG) + Smooth 

其 中 ,，P 和 G 分 别 表示 暗 条 预测 结果 和 上 暗 条 标签 ; N(A,) 和 N(CAG) 表示 预测 结果 
和 标签 区 域 中 像素 个 数 ，Smooth=0.001， 防 止 分 母 为 0。Dice 数值 越 小 ， 检 测 结 
果 精 度 越 高 。 


3.44 ”评价 指标 


判断 上 暗 条 检测 方法 的 性 能 需要 有 效 评价 指标 , 本 文 将 暗 条 检测 结果 与 瞳 条 标签 相 比 ， 有 
4 种 检测 结果 ， 分 别 是 真 阳 性 (True Positive,TP) 表 示 检 测 正 确 暗 条 像素 点 ， 假 阳性 (False 
Positive,FP) 表 示 检 测 错 误 暗 条 像素 点 ， 真 阴性 (True Negative,TN) 表 示 检 测 正确 背景 点 ， 假 阴 
性 (False Negative,FN) 表 示 检 测 错误 背景 点 。 如 表 1 所 示 。 


Dice(P,G) -1 


表 1 全 日 面 图 像 4 种 检测 结果 


Table 1 Four results of segmentation 


检测 对 象 检测 正确 像素 检测 错误 像素 
暗 条 像素 点 真 阳性 (TP) 假 阳 性 (FP) 
背景 像素 点 真 阴 性 (TN) 假 阴 性 (FN) 


通过 表 1 检 测 结果 可 以 计算 出 准确 率 (Acc)、 召 回 率 (Recall))、 精 确 率 (Precision)3 个 衡量 方 
法 性 能 的 指标 。 b gel 正确 像素 点 占 整个 图 像 像 素 点 总 和 的 比例 ; 召回 率 是 检测 正确 

的 暗 条 像素 点 占 真 实 暗 条 像素 点 总 和 的 比例 ; 精确 率 是 检测 正确 的 暗 条 像素 点 占 检测 暗 条 像 
素 点 总 和 的 比例 ; Fl1 值 是 对 精准 率 和 召回 率 的 整体 评价 ， 介 于 0~1 之 间 。 本 文 计算 方法 如 表 
2 所 示 。 


表 2 暗 条 检测 方法 性 能 评估 指标 


Table 2 Performance evaluation index of vessel segmentation algorithms 


Assessment index Formula 
ACC TP - TN/(TP & TN + FP + FN) 
Recall TP/(TP + FN) 
Precision TP/(TP + FP) 
Fl-score 2x Precisionx Recall/(Precision+ Recall) 


3.5 ”实验 结果 
3.5.1 算 法 改进 前 后 对 比 


为 了 说 明 本 文 提出 VNet 网 络 在 下 采样 部 分 采用 inception 模 块 同时 加 入 注意 力 机 制 , 在 上 
采样 部 分 引入 深度 监督 模块 具有 一 定 的 优势 ， 本 文 将 改进 前 后 的 VNet 网 络 在 测试 集 上 进行 
测试 ， 采 用 人 工 标 注 暗 条 标签 图 和 检测 结果 进行 比较 。 表 3 列 出 了 原始 VNet 网 络 ， 加 
Inception 模 块 后 的 Inception-VNet 网 络 ， 加 入 注意 力 机 制 后 的 Attention-VNet 网 络 ， 以 及 本 
最 终 改进 后 VNet 网 络 进 行 比较 。 根 据 每 种 网 络 检 测 的 结果 与 标签 计算 出 准确 率 。 由 于 上 暗 
占 全 日 面 图 像 的 比重 约 为 5%， 导 致 检测 结果 准确 率 较 高 ， 为 了 更 好 衡量 检测 结果 ， 采 用 
回 率 、 精 准 率 、F1 值 评价 指标 ,从 表 3 可 以 看 出 , 原始 VNet 网 络 准 确 率 为 0.9661,F1 值 为 0.8168， 
说 明 原 始 VNet 网 络 检测 的 结果 可 以 较 好 地 检测 出 特征 明显 的 暗 条 ， 但 是 针对 弱小 上 暗 条 ， 仍 
然 会 出 现 漏 检 问 题 。 加 入 Inception 模 块 和 注意 力 机 制 及 深度 监督 模块 后 的 VNet 网 络 , 准确 率 
达到 0.9883，F1 值 达到 0.8385。F1l 值 有 明显 提高 ， 可 见 改进 后 VNet 网 络 在 下 采样 过 程 中 可 将 
弱小 暗 条 信息 充分 提取 ， 提 高 检测 结果 准确 率 。 
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表 3 基于 VNet 网 络 不 同 算法 性 能 指标 比较 


Table3 Performance comparison of different algorithms base on VNet networks 


Algorithm Acc Recall Precision F1 Score 
VNet 0.9661 0.8805 0.7617 0.8168 
Inception-VNet 0.9660 0.8912 0.7628 0.8220 
Attention-VNet 0.9753 0.8941 0.7713 0.8282 
Ours 0.9883 0.8998 0.7851 0.8385 


图 10 选 取 了 图 像 中 包含 弱小 暗 条 的 局 部 区 域 并 放大 2.5 倍 ， 本 文 算法 对 弱小 暗 条 检测 效 
果 与 暗 条 标签 及 原始 VNet 网 络 检测 结果 进行 对 比 。 图 中 红色 框 处 是 全 日 面 图 像 中 的 弱小 暗 
条 ， 图 10(e)-(h) 分 别 是 图 10(a)-(d) 放 大 2.5 倍 后 的 局 部 区 域 。 我 们 可 以 直观 地 看 出 ， 原 始 VNet 
网 络 检测 结果 克服 了 背景 干扰 ,但 是 对 弱小 暗 条 检测 准确 性 不 高 ， 存 在 漏 检 现 象 。 改 进 后 算 
法 在 下 采样 部 分 引入 Inception 模 块 和 注意 力 机 制 ， 提 升 网 络 性 能 ， 提 取 到 更 多 暗 条 特征 ; 在 
上 采样 部 分 引入 深度 监督 模型 ,将 检测 结果 与 每 层 特征 图 融合 , 保留 了 细节 特征 ,使 得 网 络 
同时 兼顾 语义 信息 和 细节 特征 ， 尽 可 能 地 保留 弱小 暗 条 连续 性 ， 能 够 抵抗 背景 干扰 ， 取 得 更 
加 精准 检测 结果 。 
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图 10 暗 条 检测 结果 。(a) 全 日 面 图 ，(b) 暗 条 标签 图 ，(c)VNet 检测 结果 ，(d) 本 文 检 测 结果 ; 
(e)~( 了 D) 第 一 行 对 应 图 放大 2.5 倍 结果 


Fig. 10 Filaments of segmentation results. (a) full-disk Ha solar image; (b) ground-truth image; (c) VNet 


segmentation result; (d) Our segmentation result; (e)-(f)2.5 the first row corresponds to the picture enlarged by 2.5 


times 


3.5.2 不 同 算法 评估 指标 对 比 


为 了 进一步 证 明 本 文 所 提 算 法 在 太阳 暗 条 图 像 上 的 检测 性 能 , 使 用 上 述评 价 指标 将 本 文 
所 提 算 法 与 Zhu 等 (1 提出 基于 UNet 暗 条 检测 方法 (UNet)， 以 及 在 该 方法 的 基础 上 ， 为 捕获 到 
暗 条 更 多 细节 融入 了 Resent 密 集 跳跃 连接 (Resent-UNet)。 表 4 列 出 了 不 同方 法 对 太阳 暗 条 检 
测 结 果 。UNet 网 络 检 测 的 准确 率 达 到 0.9587，F1 值 达到 0.7834， 但 其 受 图 像 中 亮度 较 低 背 景 
区 域 和 噪声 影响 严重 ， 导 致 检测 结果 错误 率 较 大 , 算法 检测 出 不 属于 暗 条 的 部 分 ， 抗 噪声 能 
力 较 弱 。Resent-UNet 将 每 个 融合 模块 通过 密集 跳跃 连接 的 方式 进行 特征 融合 ， 使 网 络 能 捕 
获 到 暗 条 更 多 细节 特征 ， 提 升 检 测 性 能 ， 准 确 率 达 到 0.9$98，F1 值 也 达到 0.7947， 但 其 精 丰 
率 较 低 , 说 明 网 络 过 于 敏感 ,会 将 一 些 亮度 较 暗 的 背景 部 分 误 识别 为 太阳 上 暗 条 。 本 文 方法 上 暗 
条 检测 平均 准确 率 高 达 0.9883，F1 值 达到 0.8385， 高 于 UNet 和 Resnet-UNet 网 络 平均 准确 率 ， 


评价 PI 信也 达到 了 较 训 水 平 ， 因 此 本 六 方法 更 具有 优势、 
表 4 有 上 暗 条 检测 方法 性 能 评估 指标 


Table4 Performance evaluation index of vessel segmentation algorithms 


Algorithm Acc Recall Precision F1 Score 
UNet 0.9587 0.8503 0.7262 0.7834 
Resnet-UNet 0.9598 0.8584 0.7398 0.7947 
VNet 0.9661 0.8805 0.7617 0.8168 
ours 0.9883 0.8998 0.7851 0.8385 


为 了 更 直观 地 展示 本 文 方法 实验 效果 , 对 太阳 暗 条 图 像 , 在 同等 条 件 下 将 本 文 算法 与 上 
述 暗 条 检测 算法 在 测试 集 上 进行 主观 测评 。 其 实验 结果 如 图 11 所 示 。 

从 图 11 可 以 看 出 ， 图 11(a) 中 红色 框 处 是 全 日 面 图 像 中 弱小 暗 条 ， 图 11(b) 是 标签 图 ， 图 
11(c) 是 传统 方法 检测 结果 ， 27 DU HERR T A 部 分 ， 但 是 由 于 背景 干扰 ， 
传统 闵 值 分 割 很 难 将 背景 噪声 点 剔除 ， 严 重 影 响 检测 结果 。 图 11(d) 是 UNet 网 络 检测 结果 ， 
可 以 看 出 检测 结果 青 景 噪声 点 干扰 较 少 ， 但 是 弱小 暗 条 会 漏 检 。 图 11(e) 是 resent-UNet 检 测 结 
果 ， 可 以 看 出 加 入 残 差 结 构 后 ， 网 络 提取 特征 能 力 得 到 加 强 ， 相 比 原始 UNet 网 络 可 以 检测 
到 更 多 弱小 暗 条 ， 但 是 背景 对 比 度 较 低 的 区 域 仍然 存在 漏 检 现 象 。 图 11( 是 本 文 检 测 结果 ， 
使 用 改进 后 VNet 网 络 ， 可 以 有 效 完成 太阳 暗 条 检测 任务 ， 获 得 较 好 的 性 能 指标 ， 具 有 较 高 


的 稳定 性 和 抗 干 扰 能 力 。 从 图 11( 可 以 看 出 在 背景 较为 复杂 的 上 暗 条 图 像 检测 任务 中 , 对 弱小 
暗 条 仍 可 以 具 
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有 较 好 检测 效果 ， 具 有 一 定 算法 先进 性 。 


图 11 不 同 算法 检测 结果 。(a) 全 日 面 Ha 图 像 ，(b) 太 阳 暗 条 标签 图 ，(c) 传 统 方法 检测 结果 (d)UNet 检测 
结果 ; (e)resent-UNet 检测 结果 ; (f) JI Sc du] zs 


Fig. 11 Segmentation results of different algorithms.(a) full-disk Ha solar image; (b) ground-truth image; (c) the 


segmentation result using traditional image processing; (d) the segmentation result using UNet image processing; 


(e) the segmentation result using resent-UNet image processing; (f)our segmentation result 


4 结论 


本 文 在 太阳 瞳 条 检测 研究 中 , 针对 国家 天 文 台 数据 集 标 签 中 存在 太阳 黑子 和 噪声 干扰 及 
遗漏 弱小 瞳 条 的 问题 , 结合 太阳 磁 图 剔除 了 图 像 中 黑子 和 噪声 干扰 , 制作 了 太阳 瞳 条 数据 集 ， 
使 网 络 能 学 习 到 精确 的 暗 条 信息 ; 针对 瞳 条 检测 中 存在 背景 干扰 ， 弱 小 瞳 条 丢失 等 问题 ， 本 
文采 用 了 VNet 网 络 并 进行 改进 ， 引 入 Inception 模 块 ， 得 到 暗 条 不 同 尺 度 信 息 ， 更 好 地 利用 网 
络 内 部 计算 资源 ， 提 取 到 更 多 图 像 特 征 ; 引入 注意 力 机 制 , 达到 增强 上 暗 条 特征 同时 抑制 无 / 
背景 信息 ; 在 上 采样 部 分 引入 深度 监督 模块 ,使 不 同 尺 度 特征 图 都 能 学 到 最 准确 的 特征 ， 提 
高 太阳 上 暗 条 检测 准确 率 。 根 据 瞳 条 检测 评价 指标 可 知 ,采用 本 文 方法 的 检测 结果 有 明显 提升 。 
在 后 续 研 究 中 ， 存 在 数据 集 图 像 较 少 的 问题 ， 因 此 ， 本 文 未 来 工作 方向 是 研究 如 何 用 少量 图 
像 训练 出 高 效 检测 模型 。 
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Solar filament recognition based on improved VNet 


Xin Ze-huan, Shang Zhen-hong' 
(Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China) 

Abstract: The Solar filaments is a common solar activity, and the efficient and accurate 
detection of the solar filaments is of great significance to the study of the solar magnetic field. Due 
to the fact that the full-plane image has the characteristics of dimming, uneven brightness, and the 
inaccuracy of the labeled data set, the result of dark strip segmentation is not accurate, weak and 
small filaments are missed, and darker background parts are falsely detected as filaments And 
other issues. Therefore, a method for detecting solar filaments based on improved V Net network is 
proposed. First, the solar dark stripe data set was made by combining the solar magnetic map; 
secondly, the inception module was used to fuse the features of different scale feature maps in the 
down-sampling part of the VNet network, and the attention mechanism was added to enhance the 
semantic information of the dark stripe part of the feature map; Finally, a deep supervision module 
is introduced in the up-sampling part to retain more detailed features of the sun filaments. In order 
to verify the performance of the algorithm, we use a data set of 191 full-disk solar images, which 
contains a total of 3372 filaments. The average accuracy of the algorithm on the test data set is 
0.9883, the F1 value is 0.8385. The experimental results prove that this method can effectively 
identify the filaments in the full-disk solar images. 

Key words: Filaments detection; Filaments dataset; VNet; Inception; Attention mechanism; 


Deep supervision 
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